Objetivos de Aprendizagem
- Execute e interprete operações de redução em tensores multidimensionais.
- Formule a função Softmax para transformar logits em distribuições de probabilidade.
- Diagnostique problemas comuns de estabilidade numérica, como estouro e subfluxo de ponto flutuante.
- Implemente o Softmax numericamente estável usando deslocamento constante e a técnica do Log-Sum-Exp.